這是高市府跟酷奇思數位園有限公司共同舉辦的提案競賽。分別分為兩組:市政提案議題組、特定資料集視覺化應用組(創代科技贊助獎項)。
我們選了特定資料及視覺化應用這組,而所謂的特定資料集是 2017 年 7 月到 8 月期間的高雄市計程車起訖點資料。
你可以搭配其他開放資料集做混搭應用,也可以只單純利用這份計程車資料集做一些應用加值。
計程車可以跟什麼資料做結合?捷運?公車?公共自行車?
以視覺化而言,疊圖是一個常見的方式,但是疊完之後要從其中找到問題跟方向,才是資料科學最重要的價值,否則疊圖就是淪落為無用的視覺化工具。
從資料混搭的方向下手的話,必須先找到其他跟交通有關的資料集。中間嘗試疊其他的捷運路線圖、公車路線圖...等等,但總是在疊完圖之後就找不到任何可以衍生應用的地方。
因為特定資料集裡只有計程車起訖點位置跟時間,除了地圖幾乎沒有什麼其他方向可以做(有可能只是我們想不到)。因此參考了很多地圖相關的視覺化網站,其中印象最深刻的是紐約計程車的網站:NYC Taxi: A Day in the Life
利用可愛的動畫呈現計程車的一天:路線,上下車時間、地點外,甚至還可以看到那臺計程車的承載人數以及預估的車費。
不過我們的資料集只有起訖點
跟時間
,甚至連行徑路線都沒有,那該怎麼辦?
這是我們團隊報個第一個競賽,沒有任何競賽經驗的我們,其實很快就卡關了。在沒有任何的頭緒下,我們還是決定先疊圖再說,看能不能從地圖找到什麼蛛絲馬跡。
疊完長這樣,這是上車點的部分,紅色代表上車點較密集,不過紅色的點這麼多,看起來毫無規則可言。
後來我們決定縮小範圍,只觀察高雄大型交通點的上下車:
我們決定不再觀察整個高雄市,而是鎖定這三個點的上下車模式。
先看看高鐵左營站
上車情況:
下車情況:
可以看到紅點都很集中,嗯嗯,看起來沒什麼問題。
高雄火車站
上車情況:
下車情況:
相較於左營,火車站的站點非常稀疏。但是上車又比下車的點多了許多。
小港機場
上車情況:
下車情況:
上車很多,下車很少
有發現以上的情況嗎?統計一下給大家看吧
很有趣的是,高鐵左營的計程車需求遠遠大過火車站跟機場。
而火車站跟機場的下車數又比上車數還多很多(將近 20 倍的差距)
所以我們就開始思考為什麼會有這樣的現象,歸納出以下幾點:
既然火車站跟機場的上車人數不多,那麼在那邊排班的計程車,是不是很大的可能都在做白工?
歸納出原因跟問題後,還是要提出一些解決方法,整份專案才顯得完整。
地圖上亦呈現其他上下車需求多,但是卻缺乏計程車的熱區,像是一些百貨公司、商圈等等。
因此我們試圖拉出一些共乘模式計費公式、潛在熱區,讓計程車相關單位去安排是不是有其他地方更適合計程車。
解決方案我們沒有著重太多,畢竟比我們專業的交通科系學生應該會專業更多。我們做的事情就是嘗試從資料找出問題
。
很幸運地,我們拿了這組的金質獎。用到的資料除了競賽所提供的計程車資料,還疊個捷運路線圖,如此而已。
會想到從高雄三大交通站點出發,也是某一天晚上開會時,卡關卡到快放棄的時候蹦出來的想法。
剛開始可能會覺得,資料多一點就會找到很多方向跟方法,但事實證明是一堆資料疊在地圖上不會讓你找到你想要解決的問題。找到一個方向鎖定,然後再去看有沒有適合的資料集,會比較有全盤的考量,也才比較不會找到解決 A 的方法卻又跟 B 問題衝突這種矛盾現象。